بهبود طبقه بندی متن با استفاده از روش های ترکیب
thesis
- وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده مهندسی
- author علی دانش
- adviser بهروز مینایی فردین اخلاقیان
- Number of pages: First 15 pages
- publication year 1391
abstract
با توجه به گسترش اینترنت و افزایش چشمگیر حجم مطالب متنی، ابزارها و روش های خودکار برای مدیریت اسناد و مطالب متنی، مورد توجه بسیار زیادی قرار گرفته اند. از جمله ی این ابزارها می توان به طبقه بند متن اشاره کرد که می تواند در این زمینه بسیار موثر باشد. این ابزار کاربردهای فراوانی در سیستم های بررسی متون مانند موتورهای جستجو، سیستم های فیلترینگ، تشخیص هرزنامه ها، کتابخانه های دیجیتال و سایر سیستم های مشابه دارد. از آن جایی که صحت طبقه بندی متن یکی از مهمترین شاخص های موفقیت این سیستم ها به شمار می آید، از اهداف اساسی این پایان نامه افزایش میزان صحت طبقه بندی متون می باشد. با توجه به میزان کارهای انجام شده قبلی، افزایش کارایی طبقه بندهای منفرد مشکل می باشد، لذا رهیافت ما برای رسیدن به این هدف استفاده و بهبود روش های ترکیب طبقه بندها است. در این پایان نامه برای بهبود صحت طبقه بندی متن، و بر مبنای روش ترکیب رأی گیری وزن دار، دو رهیافت جدید برای وزن دهی طبقه ها و طبقه بندها پیشنهاد شده است. رهیافت اول مبتنی بر در نظر گرفتن وزن مستقل برای هر طبقه و هر طبقه بند است. رهیافت دوم تعمیم رهیافت اول است. بدین شکل که برای جواب مثبت یا منفی هر طبقه بند در مورد هر طبقه وزن مستقلی در نظر گرفته می شود. برای محاسبه ی اوزان در هر دو رهیافت، علاوه بر الگوریتم ژنتیک، معادله تجربی خاصی هم پیشنهاد گردیده است که در زمان بسیار کمتری نسبت به الگوریتم ژنتیک اجرا می گردد. نتایج طبقه بندی بر مبنای محاسبه اوزان با استفاده از معادله ی پیشنهادی، کاملاَ با نتایج استفاده از الگوریتم ژنتیک قابل مقایسه و حتی گاهی بهتر هم می باشد. آزمایش ها با استفاده از طبقه بندهای رُکیو، نزدیک ترین همسایه و بیز، و سه روش انتخاب ویژگی شامل اطلاعات متقابل، خی2 و mcfs انجام شده است. نتایج تجربی حاصل از اعمال الگوریتم های ترکیب پیشنهادی بر روی مجموعه داده های آموزشی رایج و مقایسه با نتایج حاصل از سایر روش های ترکیب طبقه بندها، مانند رأی گیری وزن دار، عملگر میانگین وزن دار رتبه یافته و روش قالب تصمیم، نشان می دهد که رهیافت های پیشنهادی دقت طبقه بندی را بنحو چشمگیری افزایش داده اند. این نتایج از آزمایش بر روی چهار مجموعه داده های آموزشی متفاوت و رایج بدست آمده است.
similar resources
افزایش نرخ کارایی طبقه بندی با استفاده از تجمیع ویژگی های موثر روش های مختلف ترکیب شبکه های عصبی
Both theoretical and experimental studies have shown that combining accurate Neural Networks (NN) in the ensemble with negative error correlation greatly improves their generalization abilities. Negative Correlation Learning (NCL) and Mixture of Experts (ME), two popular combining methods, each employ different special error functions for the simultaneous training of NN experts to produce negat...
full textطبقه بندی سنگ های ساختمانی از دیدگاه قابلیت برش با استفاده از روش خوشه بندی فازی
پیش بینی قابلیت برش سنگ به عنوان یکی از فاکتورهای موثر در تخمین هزینهها و پیش بینی میزان تولید یک کارخانه فرآوری سنگ از اهمیت بالایی برخوردار میباشد. بنابراین شناخت کامل سنگهای ساختمانی و ارزیابی توان اجرایی دستگاههای برش در کارخانههای فرآوری، طراحان و برنامهریزان تولید را به سمت بهبود سرعت فرآوری و افزایش تولید سوق میدهد. از اینرو، به کارگیری روشهای نو و کاربردی برای دستیابی به این اه...
full textطبقه بندی سواحل چابهار از دیدگاه واکنش های خط ساحلی با استفاده از روش های تجربی
طبقه بندی سواحل با توجه به ویژگی های امواج، کشند، رسوب و شرایط مورفودینامیکی باعث شناخت عمده ای از ساحل می شود. بندر چابهار از نظر اقیانوس شناسی، سیاسی و اقتصادی از اهمیت زیادی برخوردار است. در این تحقیق، با در نظر گرفتن پارامترهای بدون بعد، واکنش های خط ساحلی بر اساس شرایط هیدرودینامیکی با استفاده ازسه روش هانسن، هایس و مسلینک و شرت در سه ایستگاه در خلیج چابهار و بر اساس داده های میدانی موج و ...
full textطبقه بندی سنگ های آهکی براساس خصوصیات سنگشناسی و ترکیب شیمیایی با استفاده از روش پردازش تصویر و شناخت الگو
رویکرد پردازش تصویر، یکی از ابزارهای کاربردی در مقوله طبقهبندی و تشخیص دیجیتال نوع سنگشناسی است. در این مقاله، تفکیک نمونههای سنگ آهک از نظر میزان خلوص کربنات کلسیم، با استفاده از کمّیسازی ویژگیهای تصویری نمونهها و الگوریتم آماری بیزین، مطالعه شده است. بدین منظور تعداد 30 نمونه سنگ آهک از معدنی در منطقه لاج سمنان برداشت شد. هریک از این نمونهها توسط سنگشکن فکی خرد و بخشهایی از ن...
full textارائه روشی برای طبقه بندی داده های ابرطیفی aviris ، با استفاده از استخراج ویژگی و ترکیب طبقه بندی کننده ها
یکی از پرکاربردترین روش های طبقه بندی نظارت شده، روش بیشترین احتمال است که در آن، به منظرو طبقه بندی از پارامترهایی آماری مانند ماتریس واریانس کوواریانس استفاده می شود. در تصاویر ماهواره ای ابر طیفی، به علت محدودیت نمونه های آموزشی و ابعاد بالای طیفی (زیاد بودن تعداد باند ها)، احتمال یکتا شده ماتریس های برآورد شده و با کاهش دقت طبقه بندی وجود دارد. به منظور حل این مشکل از روش های مختلفی همچون ک...
full textارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده میشود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند میتواند در یک، چند و یا هیچ دستهای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار میگیرد. این موضوع میتواند در قالب یک ی...
full textMy Resources
document type: thesis
وزارت علوم، تحقیقات و فناوری - دانشگاه کردستان - دانشکده مهندسی
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023